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cDNA-Sequenz eines Interaktors FANCIP1 des Fanconi-Anamie-Proteins der 
Komplementationsgruppe A 
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Beschreibung 
Umfang der Erfindung 

Die vorliegende.Erfindung betrifft die cDNA eines Interaktors (FANCIP1) des Fanconi- 
1 0 Anamie Proteins der Komplementationsgruppe A (FANCA) sowie das davon codierte 

Protein. Weitere Gegenstande sind das entsprechende Gen, gegen das Protein 
^^^^jerichtete Antikorper, FANCIPI-transgene Organismen und Zellen sowie die 
X^^^perwendung von FANCiPl zum Effektor-Screening und die pharmazeuiische 

Anwendung der Nukleinsaure, des Proteins und der Antikorper. 

15 

Hintergrund der Erfindung 

Fanconi-Anamie (im folgenden als „FA" bezeichnet) ist eine autosomal rezessiv 
erbliche Erkrankung, die sich klinisch mit Symptomen wie progressive Pancytopenie, 
angeborenen Miftbildungen und erhdhtem Risiko fur Krebserkrankungen manifestiert 
20 (Glanz und Fraser, 1982). Mindestens 15% der FA-Patienten entwickeln myeloische 
Leukamien (Auerbach und Allen, 1991). 

^^^Kytogenetisch sind FA-Zellen durch eine Hypersensitivity gegenuber DNA- 
^^^quervernetzenden Agenzien, wie z.B. Mitomycin C (MMC) und Diepoxybutan (DEB), 
25 charakterisiert, die sich in Chromosomenbruchen und -aberrationen manifestiert 

(Auerbach, 1993). FA-Lymphozyten und -Fibroblasten weisen nach Behandlung mit 
MMC eine Verzogerung bzw. einen Arrest in der G2-Phase des Zellzyklus auf (Kubbies 
et al., 1985; Seyschab et al., 1995). Zudem ist bei FA-Zellen eine erhbhte 
Sauerstoffempfindlichkeit zu beobachten (Joenje et al. 1981; Schindler und Hoehn, 
30 1988; Poot et al., 1996). 

Anhand somatischer Zellfusionsstudien konnten fur FA mindestens acht verschiedene 
Komplementationsgruppen (A bis H) unterschieden werden (Joenje et al., 1997). 
Bisher wurden die Gene fur drei Komplementationsgruppen identifiziert: FANCC 
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(Strathdee et al., 1992; W093/22435), FANCA (Lo Ten Foe et al., 1996; The Fanconi 
anaemia/Breast cancer consortium, 1996; W098/14462) und FANCG (Saar et al., 
1 998; De Winter et al., 1 998). Obwohl die molekulare Wirkungsweise der FA-Proteine 
immer noch unbekannt ist, deutet der zellulare Phanotyp und das erhdhte Krebsrisiko 
5 bei einem Gendefekt auf eine Beteiligung bei der DNA-Reparatur, der Zellzyklus- 
Regulation und/oder der Hamatopoiese hin. Die Ahnlichkeit des klinischen und 
zellularen Phanotyps der verschiedenen Komplementationsgruppen und die 
Erkenntnis, daft das FANCA- und das FANCC-Protein unter FANCA-Phosphorylierung 
interagieren und, als Komplex in den Zellkern transportiert werden (Kupfer et al., 1997a, 
10 Yamashita et al., 1998), lassen auf eine Protein-Kaskade oder ein funktionelles 
Zusammenwirken in einem Komplex schlieften. 

^j^ntscheidende Fortschritte bei der Entschlusselung der molekularen Ursachen der FA- 

Pathogenese kbnnen uber die Identir'ikaiion der beteiiigten Gene bzw. Proteine erzieit 
15 werden. Als FANCC-lnteraktoren sind bislang die Cyclin-abhangige Kinase cdc2 
(Kupfer et al., 1997b), das Chaperon GRP94 (Hoshino et al., 1998) und die 
NADPH:Cytochrom c-Reduktase (Kruyt et al., 1998) verbffentlicht, als potentiell 
Pathogenese-relevant wurden die Fanconi-Gene 1 und 2 eingestuft (Planitzer et al., 
1998; W098/16637 und W098/45428). 

20 

Die Aufgabe der vorliegenden Erfindung bestand darin, Interaktoren der Fanconi- 
k Anamie-Proteine FANCA und FANCC zu finden. Auf Grundlage der FA-Pathogenese 

•Is Modellsystem fur Mechanismen zur Aufrechterhaltung genetischer Stabilitat war 
as Ziel, Bestandteile eines Proteinkomplexes bzw. einer Proteinkaskade zu 
25 identifizieren, die eine Rolle bei der DNA-Reparatur, der Zellzyklusregulation und/oder 
der Onkogenese spielen. 

Zusammenfassung der Erfindung 

Die vorliegende Erfindung beschreibt die Identifizierung einer cDNA, die fur ein neues 
30 Protein codiert und mit FANCIP1 bezeichnet wurde. Die cDNA-Sequenz wurde unter 
Verwendung einer Interaction Trap-Version des Hefe-Two Hybrid-Systems (Fields und 
Song, 1989; Finley Jr. et al., 1996) gefunden, wobei das Protein der 
Komplementationsgruppe A (FANCA) als Koder diente. Das durch die FANCIP1-cDNA 
codierte Protein interagiert mit FANCA und kann somit Teil des Komplexes bzw. der 
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Signaltransduktionskaskade sein, die bei Defekt zur FA-Pathogenese fuhrt. Die 
FANCIP1-cDNA und das davon codierte Protein, aber auch das entsprechende Gen 
und gegen das Protein gerichtete Antikorper sind daher als diagnostische, 
therapeutische oder preventive Mittel fur Erkrankungen geeignet, die mit DNA- 
5 Reparatur-Defekten, Zellzyklus-Storungen, Cytopenien, Tumorgenese und/oder 

Tumorprogression assoziiert sind. Sie konnen weiterhin als Targets fur Verfahren zum 
Effektor-Screening dienen, um neue Medikamente zur Behandlung der zuvor 
genannten Erkrankungen zu entwickeln. 

10 Die vorliegende Erfindung betrifft eine Nukleinsaure, welche 



die in Fig. 1 dargestellte Nukleotidsequenz oder einen Protein- 

codiersnden Abschniti davon, 

eine der Sequenz aus a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz, 
eine mit den Sequenzen aus a) und/oder b) unter stringenten 
Bedingungen hybridisierende Nukleotidsequenz oder 
eine zu den Sequenzen aus a) und/oder b) komplementare 
Sequenz umfaRt. 



Die in Fig. 1 dargestellte Nukleotidsequenz enthalt einen offenen Leserahmen, der 
einem Protein mit einer Lange von 308 Aminosauren entspricht. Die 
^minosauresequenz dieses Proteins ist in Fig. 2 dargestellt. 

In der EST-Sequenzdatenbank am National Center for Biotechnology Information 
(NCBI) finden sich humane cDNA-Klone, die Teilbereiche der in Fig. 1 angegebenen 
Nukleotidsequenz enthalten. Folgende homologe humane ESTs wiesen einen 
statistischen Wahrscheinlichkeitswert von weniger als 0,5 auf: Zugangsnummern 
AA1 65403, AA455594, AA314472, AA452340, N34087, AA1 82700, N41615, 
AA470049, AA463289, AA1 32459, W31487, R56355, H58271, H16122, VV77956, 
AA1 93332, AA323923, AA370209, AA296758, W72757, AA093971, AA385544, 
AA1 65402, H42806, AA093977, AA37001 1 , AI161 152, R71215, AA386175, 
AA885343, T79297, R81567, AI082713, N29615, W04568, N40176, AA862385, 
AA953985, AA761084, AA416877, AA452117, AI143379, AA576229, W16851, 
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AA993074, AA569223, AA074872, AA463198, AA857004, H58663, H15819, 
AA206059, AA961068, T84789, AA507257, AA707515, AA1 32458, T79211, 
AA1 79262, N25699, T99574, T99363, AA713668, T91119, AA370208, R81568, 
W1505, AI038899, AA885960, R56263, AA825431, T99147, AA194115, HUML1488, 
5 C21420, AF049564, AM 9841 4 und W31868. Unter diesen Zugangsnummern finden 
sich jedoch keine Angaben uber einen vollstandigen offenen Leserahmen Oder uber 
eine mogliche biologische Funktion. 

Die vorliegende Erfindung umfaRt neben der in Fig. 1 gezeigten Nukleotidsequenz und 
10 einer dieser Sequenz im Rahmen der Degeneration des genetischen Codes 

entsprechenden Nukleotidsequenz auch noch eine Nukleotidsequenz, die mit einer der 

•uvor genannten Sequenzen hybridisiert. Der Begriff "Hybridisierung" gemaft 
orliegender Erfindung wird wie bei Sambrook et al. (1989) verwendet. 

15 Die erfindungsgemafte Nukleinsaure umfalSt einen Protein-codierenden Abschnitt der 
in Fig. 1 dargestellten Nukleotidsequenz oder eine Sequenz, die eine Homologie von 
mehr als 65%, vorzugsweise mehr als 80 % oder einen vorzugsweise mindestens 15 
Nukleotide langen Abschnitt davon aufweist. Weiterhin kann die erfindungsgemafte 
Nukleotidsequenz auch eine RNA oder ein Nukleinsaureanalogon, z.B. eine Peptid- 

20 Nukleinsaure, umfassen. 

^ Erfindungsgemafle Nukleinsauren konnen aus Saugem nach bekannten Techniken 
^^^knter Verwendung kurzer Abschnitte der in Fig. 1 gezeigten Nukleotidsequenz als 
^^^^lybridisierungssonden und/oder Primer nach bekannten Methoden isoliert werden. 
25 Weiterhin konnen erfindungsgemaGe Nukleinsauren auch durch chemische Synthese 
hergestellt werden, wobei ansteile der ublichen Nukleotidbausteine auch modifizierte 
Nukleotidbausteine (z.B. methylierte oder 2'-0-alkylierte Nukleotide oder 
Phosphorthioate) eingesetzt werden konnen. Nukleinsauren, die teilweise oder 
vollstandig aus modifizierten Nukleotidbausteinen bestehen, konnen beispielsweise als 
30 therapeutische Mittel, z.B. als Antisense-Nukleinsauren oder als Ribozyme, eingesetzt 
werden. 

Die vorliegende Erfindung betrifft weiterhin einen Vektor, der mindestens eine Kopie 
einer erfindungsgemaften Nukleinsaure enthalt. Dieser Vektor kann ein beliebiger 
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prokaryotischer oder eukaryotischer Vektor sein, auf dem sich die erfindungsgemaRe 
DNA-Sequenz befindet und/oder der die Expression der erfindungsgemaden 
Nukleinsaure in einer geeigneten Wirtszeite ermdglicht. Beispiele fur prokaryotische 
Vektoren sind chromosomale Vektoren, wie Bakteriophagen, und extrachromosomale 
5 Vektoren, wie zirkulare Plasmidvektoren. Beispiele fur eukaryotische Vektoren sind 
Hefevektoren oder fur hdhere Zellen geeignete Vektoren, wie Plasmidvektoren oder 
virale Vektoren. 



Die Erfindung betrifft auch einen Vektor, der vorzugsweise mindestens einen 15 
10 Nukleotide langen Abschnitt der in Fig. 1 dargestellten Sequenz enthalt. Vorzugsweise 

besitzt dieser Abschnitt eine Nukleotidsequenz, die aus dem Protein-codierenden 
^^^Bereich der in Fig. 1 dargestellten Sequenz oder einem fur die Expression des Proteins 
^^^Wyesenilichen 39raich stammi. Diese Nukleinsauren eignen sich besonders zur 

Herstellung von therapeutisch einsetzbaren Antisense-Nukleinsauren. 

15 

Die vorliegende Erfindung betrifft weiter eine Zelle, die mit einer erfindungsgemaBen 
Nukleinsaure oder einem erfindungsgemafien Vektor transformiert ist. Die Zelle kann 
sowohl eine eukaryotische als auch eine prokaryotische Zelle sein. Beispiele 
eukaryotischer Zellen sind insbesondere Saugerzellen. Ebenfalls Gegenstand sind 
20 FANCIPI-transgene Organismen, wie z.B. knock in- oder knock out-Tiermodelle. 

Tiermodelle, die das Produkt der Nukleinsaure stabil exprimieren, werden als knock-in- 
Tiermodelle, jene, deren entsprechendes naturliches Gen gezielt zerstbrt wurde, als 
nock-out-Tiermodelle bezeichnet. 

Die vorliegende Erfindung umfaBt ein von einer wie oben angegebenen Nukleinsaure 
codiertes Protein. Dieses Protein weist die in Fig. 2 dargestellte Aminosauresequenz 
oder eine Homologie von mehr als 60%, vorzugsweise mehr als 70% zu der in Fig. 2 
dargestellten Aminosauresequenz auf. Die Erfindung betrifft auch Varianten und 
Fragmente des in Fig. 2 dargestellten Proteins. Unter Varianten sind Sequenzen zu 
verstehen, die sich durch Substitution, Deletion und/oder Insertion einzelner 
Aminosauren oder kurzer Aminosaureabschnitte von der in Fig. 2 dargestellten 
Aminosauresequenz unterscheiden. Hierunter fallen sowohl naturlich vorkommende 
allelische Variationen oder SpleiBvariationen des FANCIP1 als auch durch 
rekombinante DNA-Technologie, insbesondere durch in vitro-Mutagenese mit Hilfe von 



chemisch synthetisierten Oligonukleotiden erzeugte Proteine, die hinsichtlich ihrer 
biologischen und/oder immunologischen Aktivitat dem in Fig. 2 dargestellten Protein im 
wesentlichen entsprechen. Ebenfalls fallen unter diesen Begriff auch chemisch 
modifizierte Polypeptide. Hierzu gehdren Polypeptide, die an den Termini und/oder an 
5 reaktiven Aminosaureseitengruppen durch Acylierung oder Amidierung modifiziert sind. 

Die Erfindung betrifft ebenfalls Verfahren, die zur Herstellung des erfindungsgemafSen 
Proteins fuhren und sowohl die Kultivierung entsprechend transformierter Zellen als 
auch die Isolierung des erfindungsgemaften Proteins umfassen. 

10 

Die Erfindung betrifft weiterhin die Verwendung des erfindung sgemaften Polypeptids 

•oder Fragmenten dieses Polypeptids als Immunogen zur Herstellung von Antikorpern. 
Bie Herstellung von Antikorpern kann dabei auf ubliche Weise durch Immunisierung 

von Versuchsiieren mit dem vollstandigen Poiypeptid oder Fragmenten davon und 
15 anschlieRende Gewinnung der resultierenden polyklonalen Antiseren erfolgen. Nach 
bekannten Methoden konnen monokionale Antikdrper hergestellt werden. Die 
vorliegende Erfindung umfa&t somit auch Antikdrper gegen FANCIP1 oder eine 
Variante davon. 



20 Das von der erfindungsgemafien Nukleinsaure codierte FANCIP1 kann als Target fur 
eine gezielte Suche nach Effektoren eingesetzt werden. Substanzen, die auf das 
erfindungsgemafte Protein inhibitorisch oder aktivierend wirken, sind in der Lage, die 
^^Akurch das Protein gesteuerten Zellfunktionen selektiv zu beeinflussen. Daher konnen 
^^^Rie bei der Therapie entsprechender Krankheitsbilder, wie z.B. Cytopenien oder 
25 Tumoren, eingesetzt werden. Ein Gegenstand der Erfindung ist somit auch ein 

Verfahren zur Identifizierung von Effektoren des FANCIP1, wobei man Zellen, die das 
Protein exprimieren, mit verschiedenen potentiellen Effektorsubstanzen, in Kontakt 
bringt und die Zellen auf Veranderungen, z.B. zellaktivierende, zellinhibierende, 
zellproliferative und/oder zellgenetische Veranderungen, analysiert. Zudem konnen auf 
30 diese Weise Bindedomanen des FANCIP1 identifiziert werden. Gegenstand der 

Erfindung sind auf obengenannte Weise ermittelte pharmazeutisch wirksame Effektor- 
Substanzen. 
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Die vorliegende Erfindung betrifft auch eine pharmazeutische Zusammensetzung, die 
als aktive Komponente Nukleinsauren, Vektoren, Zellen, Polypeptide, Antikorper 
und/oder Effektor-Substanzen wie zuvor angegeben enthalt und weiterhin 
pharmazeutisch Qbliche Trager-, Hilfs- und/oder Zusatzstoffe sowie gegebenenfalls 
5 weitere aktive Komponenten enthalten kann. Die pharmazeutische Zusammensetzung 
kann insbesondere zur Diagnostik, Therapie oder Prevention von Erkrankungen 
eingesetzt werden, die mit DNA-Reparatur-Defekten, Zellzyklus-Stdrungen, 
Cytopenien, Tumorgenese und/oder Tumorprogression assoziiert sind. Dies gilt auch 
fur die Diagnostik einer Predisposition fur solche Erkrankungen bei Individuen, 

1 0 insbesondere bei der Diagnostik eines Risikos fur Cytopenien und/oder 

Tumorerkrankungen. Weiterhin wird eine gezielte Diagnostik von Krankheiten 

^^^ermdglicht, die mit Veranderungen der Aktivitat des FANCIP1 direkt oder indirekt 

P^^B-erbunden sind. Diese Uniersuchungen konnen mit Hilfe spezifischer 

Nukleinsauresonden zum Nachweis auf Nukleinsaureebene, z.B. auf Gen- oder 

15 Transkriptebene, oder mit Hilfe von Antikorpern gegen FANCIP1 zum Nachweis auf 
Proteinebene durchgefuhrt werden. 



Bei Krankheitsbildern, die auf einen Ausfall des FANCIP1 zuruckzufuhren sind, kann 
eine gentherapeutische Behandlung erfolgen, welche die Ubertragung einer fur das 

20 FANCIP1 codierenden Nukleinsaure mittels Vektoren, z.B. viralen Vektoren, in das 
entsprechende Zielgewebe umfaftt. Andererseits kann bei Krankheitsbildern, die auf 
eine unkontrollierte Expression des FANCIP1 zuruckzufuhren sind, eine 

^^^kpentherapeutische Behandlung erfolgen, welche zu einer Blockierung dieser 

^^^^xpression fuhrt. 

25 

Die vorliegende Erfindung betrifft auch ein Verfahren zur Diagnostik der oben 
genannten Erkrankungen, wobei man einen Patienten oder eine aus einem Patienten 
stammende Probe, z.B. eine Probe einer Korperfiussigkeit oder eines Gewebes, mit 
einer erfindungsgemaften pharmazeutischen Zusammensetzung in Kontakt bringt und 
30 die Nukleotidsequenz und/oder die Expression der erfindungsgemaden Nukleinsaure 
qualitativ oder quantitativ bestimmt. Diese Bestimmungsmethoden konnen 
beispielsweise auf Nukleinsaureebene durch Verwendung von Nukleinsaure- 
Hybridisierungssonden oder uber Reverse Transkription/PCR bzw. auf Proteinebene 
durch Antikorper nach cyto- oder histochemischen Methoden erfolgen. Die 
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pharmazeutische Zusammensetzung kann als Marker fur das Auftreten von 
Cytopenien, Tumoren oder anderer proliferationsassoziierter Erkrankungen oder einer 
Predisposition fur die genannten pathophysiologischen Veranderungen verwendet 
werden. 

5 

SchlieRlich betrifft die vorliegende Erfindung auch ein Verfahren zur Therapie oder 
Prevention einer der zuvor genannten Erkrankungen, wobei man dem Patienten eine 
erfindungsgemafie pharmazeutische Zusammensetzung verabreicht, die die aktive 
Komponente in einer gegen die Erkrankung wirksamen Menge enthalt. Spezifische 
1 0 Beispiele fur pharmazeutische Zusammensetzungen, welche fur therapeutische 
Zwecke geeignet sind, sind beispielsweise bispezifische Antikorper und Antikorper- 

•Toxine bzw. Antikdrper-Enzymkonjugate. Weitere bevorzugte pharmazeutische 
lusammensetzungen fur therapeutische Zwecke sind Antisense-Nukleinsauren, 
gentherapeutische Vektoren oder Effektor-Substanzen, z.3. in Form niedermoiekularer 
1 5 Aktivatoren oder Inhibitoren. 



Detaillierte Beschreibung der Erfindung 
Interaction Trap 

20 Zur Klonierung von cDNAs, deren Genprodukte mit dem Fanconi-Anamie-Protein 
FANCA interagieren und damit eine Rolle bei der FA-Pathogenese spielen kbnnen, 
wurde eine Interaction Trap-Version des Hefe-Two Hybrid-Systems (Fields und Song, 

^^^^89; Finley Jr. et al., 1996) eingesetzt. 

25 Fur die Konstruktion des FANCA-Koderproteins wurde die komplette codierende 

Sequenz des FANCA-Proteins in den Vektor pEG202 uber die EcoRI-Schnittsteile im 
Leserahmen mit der fur die LexA-DNA-bindende Domane codierenden Region kloniert. 
Fur die Expression des Beuteproteins wurde der Vektor pJG4-5 verwendet, der die 
Konstruktion von Fusionsproteinen mit der B42-transaktivierenden Domane erlaubt. Mit 

30 dem FANCA-Kdderprotein wurde eine in diesen Vektor als Fusionsgenbank klonierte 
HeLa-cDNA-Bibliothek durchmustert. 
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Als Wirtsorganismus diente der Hefestamm EGY48. Der Nachweis einer positiven 
Interaktion erfolgte durch Trankriptionsaktivierung des LEU2-Gens, woraus Wachstum 
der Hefen auf Leucin-freiem Medium resultiert. 

5 Vor Durchfuhrung des Interaction Traps wurde durch Ausplattieren pEG202FANCA- 
transformierter EGY48-Hefen auf Glucose-Medium ohne Histidin und Leucin 
sichergestellt, daft keine intrinsische transaktivierende Eigenschaft des FANCA-Koder- 
Fusionskonstruktes vorliegt. 

1 0 Mit pEG202FANCA und der B42-Fusionsgenbank cotransformierte EGY48 wurden auf 
Leucin-haltigem Medium auf Erhalt beider Vektoren vorselektiert und aufgenommen. 
^^^Fur die Suche nach interagierenden Hefeklonen wurden Aliquots auf Leucin-freiem 
W^P ^Iedium ausplattiert und 3 bis 5 Tage bei 30 °C inkubiert. Insgesamt wurden Aliquots 
entsprechend einer Menge von 1 x 10 s Transfektanten durchmustert. Die Abhangigkeit 
1 5 der Transkriptionsaktivierung positiver Klone von der Expression des Beuteproteins 
wurde auf Leucin-freiem Glucose-Medium uberpruft. Die Isolierung der Interaktor- 
Plasmide erfolgte nach Aufzucht der Hefen in Glucose-Medium ohne Tryptophan, 
Elektroporation des Nukleinsaure-lsolats im E.coli-Stamm XLIblue (Stratagene) und 
Plasmidpraparation aus den Bakterienzellen. Zur Bestatigung der Interaktionen wurden 
20 Retransformationen des isolierten Beute-lnteraktors in Kombinationen mit 

unterschiedlichen Kbderkonstrukten durchgefuhrt. In Kombination mit pEG202FANCA 
p^^wurde die zuvor beobachtete Interaktion bestatigt. AuBerdem wurden mdgliche 
i^^Bknteraktionen mit dem LexA-Fusionspartner ausgeschlossen, indem einerseits mit dem 
^^R)EG202-Leervektor co-retransformiert wurde und andererseits mit einem LexA-DNA- 
25 Ligase-Koderfusionskonstrukt als Negativkontrolle. 

Sequenzanalyse der FANCIP1-cDNA 

Die Lange der Genbank-cDNAs der isolierten Interaktorklone wurde durch EcoRI/Xhoi- 
Restriktionshydrolyse bestimmt. Die Ansequenzierung der cDNAs erfolgte durch eine 
30 automatisierte Cycle Sequencing-Methode (Applied Biosystems) unter Verwendung 
des Nukleinsaureprimers Bco I (5 - ACC AGC CTC TTG CTG AGT GGA GAT G-3'). 
Die vollstandige Sequenzierung des Vektors mit inseriertem FANCIP1-cDNA-Fragment 
erfolgte mit den Nukleinsaureprimern Bco I und Bco II (5'-GAC AAG CCG ACA ACC 
TTG ATT GGA G-3') durch die Firma Sequence Laboratories Gbttingen. 
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Zur Ermittlung der 5'-Bereich-Teilsequenz der gefundenen Nukleotidsequenz wurde der 
573" RACE Kit (Boehringer-Roche) verwendet. Hierbei kamen die sequenzspezifischen 
Primer FANCIP1-SP1 (5'-GGG GGC AGG AAT ATG AGA GG-3') und FANCIP1-SP2 
(5'-TTT AGG GGG AAG TGT ACC TG-3') zum Einsatz. Das erhaltene PCR-Produkt 
5 wurde elektrophoretisch gereinigt (JETquick Gel Extraction Kit, GENOMED) und unter 
Verwendung des T7 Sequenase Version 2.0 DNA Sequencing Kit (Amersham- 
Pharmacia) und des oben genannten Primers FANCIP1 -SP2 direkt sequenziert. Die 
Zugehdrigkeit des erhaltenen Nukleotidfragments zum Plasmid-inserierten Interaktor- 
Fragment wurde, durch einen uberlappenden Sequenzbereich von 38 Nukleotiden 
10 bestatigt. Die zusammengesetzte Nukleotidsequenz ergab einen 1553 Nukleotide 
langen cDNA-Bereich, der einen Teil der 5'-untranslatierten Region, den gesamten 

•offenen Leserahmen von 924 Nukleotiden bzw. 308 Codons und nahezu den 
kompletten 3'-untranslatierten Bereich bis uber das Polyadenylierungssignal (AATAAA) 
hinaus umfaftt. 

15 

Urn ahnliche Nukleotidsequenzen in der Sequenzdatenbank des National Center of 
Biotechnology Information (NCBI) zu finden, wurde die cDNA-Sequenz von FANCIP1 
unter Verwendung des Blast-Programms am NCBI (http://www.ncbi.nlm.nih.gov/cgi- 
bin/BLAST/nph-newblast?Jform=1) analysiert. Nur in der EST-Datenbank ergaben sich 
20 signifikante Homologien zu humanen Klonen, die allerdings weder einen vollstandigen 
offenen Leserahmen noch Angaben zu einer moglichen biologischen Funktion 
enthielten. 




25 Kurze Beschreibung der Abbildungen 

Fig. 1 (SEQ ID NO. 1) eine Nukleotidsequenz, die den furFANCIPI codierenden 
offenen Leserahmen enthalt, 

30 Fig. 2 (SEQ ID NO. 2) die Aminosauresequenz eines offenen Leserahmens der in Fig. 
1 gezeigten Nukleotidsequenz, 

Fig. 3 (SEQ ID NOs. 3 und 4) die Nukleinsaureprimer, die zur Sequenzierung der 
Plasmid-inserierten FANCIP1 -Nukleotidsequenz verwendet wurden, 
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Fig. 4 (SEQ ID NOs. 5 und 6) die Nukleinsaureprimer, die zur 5'-RACE-Ana!yse 
verwendet wurden. 



5 
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SEQUENZPROTOKOLL 



10 



20 



(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER: 

(A) NAME: MultiGen Biotech GmbH 

(B) STRASSE: Am Hubland 

(C) ORT: Wuerzburg 

(D) BUNDESLAND: - 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: 97074 

(G) TELEFON: 0931-7058-4340 

(H) TELEFAX: 0931-7058-4355 

(I) TELEX: - 

(ii) BEZEICHNUNG DER ERFINDUNG: cDNA-Sequenz eines Interaktors FANCIP1 des 
Fanconi-Anaemie-Proteins der Komplementationsgruppe A 

(iii) ANZAHL DER SEQUENZEN: 6 

(iv) COMPUTER- LE5 BARE FAS SUNG : 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 
(C! 3ETRIZ353Y3TZM: ?C - DOS /MS -DOS 

(D) SOFTWARE: Patencln Release #1.0, Version #1.30 (EPA) 



S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 1553 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Genom-DNA 



(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : exon 

(B) LAGE:1..1553 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 



AAATGTCAGG ATTAACCTCC ATTTCAGCTA AT CAT GGGAG AGATTAAAGT 
CTCTCCTGAT 60 



TATAACTGGT TTAGAGGTAC AGTTCCCCTT AAAAAGAT T A TTGTGGATGA 
TGATGACAGT 12 0 

AAGATAT GGT CGCTCTATGA CGCGGGCCCC CGAAGTATCA GGTGTCCTCT 
CATATTCCTG 18 0 



CCCCCTGTCA GTGGAACTGC AGATGTCTTT TTCCGGCAGA TTTTGGCTCT 
GACTGGATGG 2 4 0 

GGTTACCGGG TTATCGCTTT GCAGTATCCA GTTTATTGGG ACCATCTCGA 
GTTCTGTGAT 300 

GGATTCAGAA AACTTTTAGA CCATTTACAA TTGGATAAAG TTCATCTTTT 
TGGCGCTTCT 3 60 



TTGGGAGGCT TTTTGGCCCA GAAATTTGCT GAATACACTC ACAAATCTCC 



TAGAGTCCAT 420 



TCCCTAATCC TCTGCAATTC CTTCAGTGAC ACCTCTATCT TCAACCAAAC 
TTGGACTGCA 480 

AACAGCTTTT GGCTGATGCC TGCATTTATG CTCAAAAAAA TAGTTCTTGG 
AAATTTTTCA 54 0 

TCTGGCCCGG TGGACCCTAT GATGGCTGAT GCCATTGATT T CAT G GTAGA 
CAGGCTAGAA 60 0 

AGTTTGGGTC AGAGTGAACT GGCTTCAAGA CTTACCTTGA ATTGTCAAAA 
TTCTTATGTG 660 

GAACCTCATA AAATTCGGGA CAT AC C T GT A ACTATTATGG ATGTGTTTGA 
TCAGAGTGCG 72 0 

CTTTCAACTG AAGCTAAAGA AGAAAT GT AC AAGCTGTATC CTAATGCCCG 
AAGAGCT CAT 78 0 



CTGAAACCAG GAGGCAATTT CCCATACCTG TGCAGAAGTG CAGAGGT CAA 
TCTTTATGTA 84 0 



ATCAATGGTC 900 

AGTGCCGAGG AGCTTGAGGT GCAGAAAGGC AGCCTTGGCA TCAGCCAGGA 
GGAGCAGTAG 960 

TGTGTCTCTC GCTGTCAATG AT GAGTT GAC CCGGTGTGTT CTTGTATAGT 
CAGTGGCATC 1020 

AGCACCCGTC AGCCGGCCTT TTCCTTCAGG TTCGTCAGGC TCACCGGTTC 
TCACTGTGTC 1080 

TGGGAAGTAG GACTGATGGT CAT CTT CAT G ACAGGCGGCA TCTCCACTAA 
GCCTGTGTAA 1140 



G r 



CTGTTCCCTC TTTGGTTTTC TTAGCTTTTG AATTTGAAGA AGTACTTTTG 
AAGACTCCCA 12 00 



'TTTAAGAAC CGTGCAGATT TTGCTACCAA AAGTCTTCAC CACTGTGTTC 
\ T AAG T GAAT 12 60 



GTTAATTTCT GAGGTTTGGG ACTTTGTGGT GGTTTTTTTC TTCTTTTCTT 
TTCCATTCTT 1320 

CTTTCTTTCT TTTTATGTTG TTTGCTGTAA ATGCTGCACA TCCAGATTGC 
AT AT C AG GAC 1380 

ATTGGTTATT TTATGCTTTC TTGGATATAA C CAT GAT C AG AGTGCCATGG 
CCACTACCCC 144 0 

ACTGTTTGCT CTCCTGCAAA TCAACTGCTT TTAATTTACA C T TAAACAAA 
TTGTTTTGAG 1500 



TGTTAGCTAC TGCCTTTCTA GATATTAGTC ATTTGGAATA AAAATTCAAT TTC 
1553 
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AN GAB EN ZU SEQ ID NO: 2: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 308 Aminosa 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(ix) MERKMAL: 

(A) NAME/SCHLOSSEL: Protein 

(B) LAGE:1..308 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2 : 

Met Gly Glu lie Lys Val Ser Pro Asp Tyr Asn Trp Phe Arg Gly Thr 
15 10 15 

Val Pro Leu Lys Lys lie lie Val Asp Asp Asp Asp Ser Lys lie Trp 
20 25 30 

Ser Leu Tyr Asp Ala Gly Pro Arg Ser lie Arg Cys Pro Leu lie Phe 
35 40 45 

Leu Pro Pro Val Ser Gly Thr Ala Asp Val Phe Phe Arg Gin lie Leu 



Ala Leu Thr Gly Trp Gly Tyr Arg Val He Ala Leu Gin Tyr Pro Val 
65 70 75 80 

Tyr Trp Asp His Leu Glu Phe Cys Asp Gly Phe Arg Lys Leu Leu Asp 



His Leu Gin Leu Asp Lys Val His Leu Phe Gly Ala Ser Leu Gly Gly 
100 105 110 

Phe Leu Ala Gin Lys Phe Ala Glu Tyr Thr His Lys Ser Pro Arg Val 
115 120 125 

His Ser Leu He Leu Cys Asn Ser Phe Ser Asp Thr Ser He Phe Asn 
130 135 140 

Gin Thr Trp Thr Ala Asn Ser Phe Trp Leu Met Pro Ala Phe Met Leu 
145 150 155 160 

Lys Lys He Val Leu Gly Asn Phe Ser Ser Gly Pro Val Asp Pro Met 
165 170 175 

Met Ala Asp Ala He Asp Phe Met Val Asp Arg Leu Glu Ser Leu Gly 
180 185 190 

Gin Ser Glu Leu Ala Ser Arg Leu Thr Leu Asn Cys Gin Asn Ser Tyr 
135 200 205 

Val Glu Pro His Lys He Arg Asp He Pro Val Thr He Met Asp Val 
210 215 220 

Phe Asp Gin Ser Ala Leu Ser Thr Glu Ala Lys Glu Glu Met Tyr Lys 
225 * 230 235 240 

Leu Tyr Pro Asn Ala Arg Arg Ala His Leu Lys Pro Gly Gly Asn Phe 
245 250 255 
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Pro Tyr Leu Cys Arg Ser Ala Glu Val Asn Leu Tyr Val Gin lie His 
260 265 270 



Leu Leu Gin Phe His Gly Thr Lys Tyr Ala Ala lie Asp Pro Ser Met 
275 280 285 



Val Ser Ala Glu Glu Leu Glu Val Gin Lys Gly Ser Leu Gly He Ser 
290 295 300 



Gin Glu Glu Gin 
305 



(2) AN GAB EN ZU SEQ ID NO: 3: 



4^ 



30 



35 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 
{ D ) TOPOLOGEZ: Linear 

(ii) ART DES MOLEKULS: Genom-DNA 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : exon 

(B) LAGE:1..25 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 
GTAGAGGTGA GTCGTTCTCC GACCA 



(2) AN GAB EN ZU SEQ ID NO: 



50 



(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 25 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Genom-DNA 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE:1..25 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 
GAGGTTAGTT CCAACAGCCG AACAG 



60 
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(2) AN GAB EN ZU SEQ ID NO: 5: 
(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 
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20 



30 



(ii) ART DES MOLEKULS: Genom-DNA 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE:1..25 

(xi) SEQUENZBESCHREI BUNG : SEQ ID NO: 5: 
GAGGTTAGTT CCAACAGCCG AACAG 



^(2) AN GAB EN ZU SEQ ID NO: 6: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 20 3aienpaa:e 
{ B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Genom-DNA 



(ix) MERKMAL : 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .20 

(Xi) SEQUENZBESCHREI BUNG : SEQ ID NO: 



TTTAAGGGGA ACTGTACCTC 



Patentanspruche 
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Anm. 99/001 DE 



5. 



Nukleinsaure, die 

d ) die in Fig. 1 dargestellte Nukleotidsequenz Oder einen Protein- 
codierenden Abschnitt davon, 

e) eine der Sequenz aus a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz, 

f) . e ine mit den Sequenzen aus a) und/oder b) unter stringenten 

Bedingungen hybridisierende Nukleotidsequenz Oder 
9) eine zu den Sequenzen aus a) und/oder b) komplementare 

Sequenz umfafit. 

Nukleinsaure gemafi Anspruch 1, die einen vorzugsweise mindestens 30 
Nukleotide umfassenden Protein-codierenden Abschnitt der in Fig. 1 
dargestellten Nukleotidsequenz umfafit. 

Nukleinsaure, die eine Homologie von mehr als 65% zu der Nukleotidsequenz 
gemali Anspruch 1 oder einem Abschnitt davon aufweist. 

Modifizierte Nukleinsaure oder Nukleinsaureanalogon, die eine 
Nukleotidsequenz gemalS einem der Anspruche 1 bis 3 umfafit. 

Rekombinanter Vektor, der mindestens eine Kopie einer Nukleinsaure gemafi 
einem der Anspruche 1 bis 3 oder einen Abschnitt davon enthalt. 



6. Rekombinanter Vektor gemaS Anspruch 5, der die Expression der Nukleinsaure 
in einer geeigneten Wirtszelle ermoglicht. 



7. Mit einer Nukleinsaure gemaft einem der Anspruche 1 bis 3 oder einem Vektor 
gemafi Anspruch 5 oder 6 transform ierte Zelle, ein entsprechender transgener 
Organismus oder Tiermodelle, die das Produkt der Nukleinsaure gemafi einem 
der Anspruche 1 bis 3 stabil exprimieren (knock-in) oder deren entsprechendes 
naturliches Gen gezielt zerstort wurde (knock-out). 
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8. Polypeptid Oder dessen Salz, das von einer Nukleinsaure gemaft einem der 
Anspruche 1 bis 3 codiert ist. 

9. Polypeptid gemaft Anspruch 8, das 

a) die in Fig. 2 dargestellte Aminosauresequenz oder 

b) eine Homologie von mehr als 60% zu der in Fig. 2 dargestellten 
Aminosauresequenz aufweist, oder dessen Salz. 

1 0. Fragment des Polypeptids gemaft Anspruch 8 oder 9 mit mindestens 1 00 
Aminosauren oder dessen Salz. 

11 1 . Modifiziertes Polypeptid, das eine Aminosauresequenz gemaft Anspruch 8 oder 
| 9 umfaRt. 

12. Verfahren zur Herstellung des Polypeptids gemaft Anspruch 8 oder 9, das die 
Kultivierung von Zellen gemaft Anspruch 7 umfaGt sowie die Isolierung des 
Polypeptids gemaft Anspruch 8 oder 9. 

1 3. Verwendung eines Polypeptids gemali Anspruch 8 oder 9 oder von Fragmenten 
dieses Polypeptids als Immunogen zur Herstellung von Antikorpern. 

14. Antikorper gegen ein Polypeptid gemaft Anspruch 8 oder 9. 

I Verfahren zur Identifizierung von Effektoren eines Proteins gemal3> Anspruch 8 
oder 9, mit dessen Hilfe verschiedene potentielle Effektorsubstanzen an Zellen 
getestet werden konnen, die das Protein exprimieren. 

16. Substanz, die mit Hilfe des Verfahrens gemaft Anspruch 15 erhalten wurde und 
die mit mindestens einem Bereich des Proteins gemaG. Anspruch 8 oder 9 
reagiert und/oder dieses verandert. 

17. Pharmazeutische Zusammensetzung, die als aktive Komponente 

a) eine Nukleinsaure gemaR. einem der Anspruche 1 bis 4, 

b) einen Vektor gemaft Anspruch 5 oder 6, 
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c) eine Zelle gemaG. Anspruch 7, 

d) ein Polypeptid gemaft Anspruch 8, 9,10 oder 1 1 , 

e) einen Antikdrper gemaft Anspruch 14 umfaflt oder 

f) eine Substanz gemaft Anspruch 16 

und pharmazeutisch ubliche Trager- Hilfs- und/oder Zusatzstoffe enthalt. 

18. Verwendung einer Zusammensetzung gemafi Anspruch 17 zur Diagnostik von 
Erkrankungen, die mit DNA-Reparatur-Defekten, Zellzyklus-Stdrungen, 
Cytopenien, Tumorgenese und/oder Tumorprogression assoziiert sind, oder 
einer Pradisposition solcher Erkrankungen. 

1 9. Verwendung einer Zusammensetzung gemaO. Anspruch 1 7 zur Therapie oder 
I Pravention von Erkrankungen, die mit DNA-Reparatur-Defekten, Zellzyklus- 
Stdrungen, Cytopenien, Tumorgenese und/oder Tumorprogression assoziiert 
sind. 

20. Verwendung einer Zusammensetzung gemaR Anspruch 1 7 zur Gentherapie von 
Erkrankungen, die mit DNA-Reparatur-Defekten, Zellzyklus-Stdrungen, 
Cytopenien, Tumorgenese und/oder Tumorprogression assoziiert sind. 

21. Verfahren zur Diagnostik von Erkrankungen, die mit DNA-Reparatur-Defekten, 
Zellzyklus-Stdrungen, Cytopenien, Tumorgenese und/oder Tumorprogression 

i assoziiert sind oder einer Pradisposition fur solche Erkrankungen, bei dem man 
" einen Patienten oder eine aus dem Patienten stammende Probe mit einer 
Zusammensetzung gemaft Anspruch 17 in Kontakt bringt und die 
Nukleotidsequenz und/oder die Expression einer Nukleinsaure gemal3 Anspruch 
1 bestimmt. 

22. Verfahren zur Therapie oder Pravention von Erkrankungen, die mit DNA- 
Reparatur-Defekten, Zellzyklus-Stdrungen, Cytopenien, Tumorgenese und/oder 
Tumorprogression assoziiert sind, bei dem man einem Patienten eine 
Zusammensetzung gemaR. Anspruch 17 verabreicht, die die aktive Komponente 
in einer gegen die Erkrankung wirksamen Menge enthalt. 
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Zusammenfassung Anm. 99/001 DE 

cDNA-Sequenz eines Interaktors FANCIP1 des Fanconi-Anamie Proteins der 
Komplementationsgruppe A 

5 

Die vorliegende Erfindung betrifft die cDNA eines Interaktors FANCIP1 des Fanconi- 
Anamie Proteins der Komplementationsgruppe A (FAA) sowie das davon codierte 
Protein. Weitere Gegenstande sind das entsprechende Gen, gegen das Protein 
gerichtete Antikprper, FANCIPI-transgene Organismen und Zellen sowie die 
10 Verwendung von FANCIP1 zum Effektor-Screening und die pharmazeutische 
Anwendung der Nukleinsaure, des Proteins und der Antikorper. 




Fig. 1 



AAAT G T C AGG AT T AACC T C CAT T T C AGC T AAT C ATG GGAGAGAT T AAAG TCTCTCCT GAT TATA 
ACTGGTTTAGAGGTACAGTTCCCCTTAAAAAGATTATTGTGGATGATGATGACAGTAAGATATG 
GTCGCTCTATGACGCGGGCCCCCGAAGTATCAGGTGTCCTCTCATATTCCTGCCCCCTGTCAGT 
GGAACTGCAGATGTCTTTTTCCGGCAGATTTTGGCTCTGACTGGATGGGGTTACCGGGTTATCG 
CTTTGCAGTATCCAGTTTATTGGGACCATCTCGAGTTCTGTGATGGATTCAGAAAACTTTTAGA 
CCATTTACAATTGGATAAAGTTCATCTTTTTGGCGCTTCTTTGGGAGGCTTTTTGGCCCAGAAA 
TTTGCTGAATACACTCACAAATCTCCTAGAGTCCATTCCCTAA.TCCTCTGCAATTCCTTCA.GTG 
ACACCTCTATCTTCAACCAAACTTGGACTGCAAACAGCTTTTGGCTGATGCCTGCATTTATGCT 
CAAAAAAATAGTTCTTGGAAATTTTTCATCTGGCCCGGTGGACCCTATGATGGCTGATGCCATT 
GATTTCATGGTAGACAGGCTAGAAAGTTTGGGTCAGAGTGAACTGGCTTCAAGACTTACCTTGA 
.ttgtcaaaattcttatgtggaa.cctca-taaaa.ttcggga.cata.cctgtaa.ctattatgga.tgt 
GTTTGATCAGAGTGCGCTTTCAACTGAAGCTAAAGAAGAAATGTACAAGCTGTATCCTAATGCC 

cgaagagctcatctgaaaccaggaggcaatttcccatacctgtgcagaagtgcagaggtcaatc 
t t tat g t ac agat ac at t t g c t gc aat t c cat g gaac c aaat ac gc ggc c a.t t gac c cat c aat 
ggtcagtgccgaggagcttgaggtgcagaaaggcagccttggcatcagccaggaggagcag tag 
tgtgtctctcgctgtcaatgatgagttgacccggtgtgttcttgtatagtcagtggcatcagca 
cccgtcagccggccttttccttcaggttcgtcaggctcaccggttctcactgtgtctgggaagt 
aggactgatggtcatcttcatgacaggcggcatctccactaagcctgtgtaactgttccctctt 
tggttttcttagcttttgaatttgaagaagtacttttgaagactcccattttaagaaccgtgca 
gattttgctaccaaaagtcttcaccactgtgttcttaagtgaatgttaatttctgaggtttggg 
actttgtggtggtttttttcttcttttcttttccattcttctttctttctttttatgttgtttg 
:tgtaaatgctgcacatccagattgcatatcaggacattggttattttatgctttcttggatat 
aaccatgatcagagtgccatggccactaccccactgtttgctctcctgcaaatcaactgctttt 
aatttacacttaaacaaattgttttgagtgttagctactgcctttctagatattagtcatttgg 
aataaaaat tcaatt tc 



